Mới đây, trang The Verge đã đưa tin về một động thái mới từ Apple, trong đó nhóm nghiên cứu của họ đã phát triển một công nghệ mới cho phép người dùng chỉnh sửa ảnh thông qua mô tả văn bản, không cần phải sử dụng các công cụ chỉnh sửa ảnh chuyên nghiệp.
Công nghệ chỉnh sửa ảnh MGIE: Chỉnh sửa ảnh bằng mô tả văn bản
Cụ thể, công nghệ này được gọi là MGIE (MLLM-Guided Image Editing), được phát triển bởi Apple và Đại học California, Santa Barbara. Nó cho phép người dùng cắt, thay đổi kích thước, lật và áp dụng bộ lọc cho hình ảnh thông qua lời mô tả văn bản.
Công nghệ MGIE không chỉ giới hạn ở các chỉnh sửa cơ bản mà còn có thể xử lý các tác vụ phức tạp như thay đổi hình dạng hoặc cải thiện ánh sáng của các đối tượng cụ thể trong ảnh. Điều đặc biệt là, MGIE kết hợp hai phương pháp của các mô hình ngôn ngữ đa phương thức.
Đầu tiên, MGIE học cách diễn giải lời mô tả từ người dùng, hiểu được yêu cầu chỉnh sửa của họ. Sau đó, với khả năng “tưởng tượng”, nó tự động tạo ra nội dung chỉnh sửa phù hợp với yêu cầu. Ví dụ, nếu người dùng muốn làm cho bầu trời trong ảnh sáng hơn, MGIE sẽ tự động điều chỉnh độ sáng của bầu trời mà không cần sự can thiệp thủ công. Điều này giúp tạo ra kết quả chỉnh sửa chất lượng và nhanh chóng, mang lại trải nghiệm tiện ích cho người dùng.
Khi sử dụng MGIE để chỉnh sửa ảnh, người dùng không cần phải làm quen với giao diện phức tạp hoặc sử dụng các công cụ chỉnh sửa truyền thống. Thay vào đó, họ chỉ cần gõ những yêu cầu cụ thể vào hình ảnh mà họ muốn thay đổi.
Khả năng đa dạng và linh hoạt của MGIE
Trong quá trình giới thiệu MGIE, Apple đã mô tả một số tình huống thử nghiệm, cho thấy khả năng đa dạng và linh hoạt của công nghệ này. Ví dụ, khi người dùng muốn làm cho chiếc bánh pizza pepperoni trở nên “sống động hơn”, chỉ cần gõ “make it more healthy”, MGIE sẽ tự động thêm các loại rau cải lên trên bánh. Hoặc, khi người dùng muốn “tăng độ tương phản để mô phỏng ánh sáng hơn” trong ảnh về những con hổ ở sa mạc Sahara, MGIE sẽ tự động điều chỉnh độ tương phản của ảnh để làm cho nó sáng hơn, mang lại một diễn biến tự nhiên và đáng kinh ngạc. Điều này giúp đơn giản hóa quá trình chỉnh sửa ảnh và tạo ra kết quả ấn tượng một cách dễ dàng và nhanh chóng.
Hiện tại, Apple đã phát hành công nghệ MGIE thông qua GitHub để nhà phát triển có thể trải nghiệm và sử dụng. Tuy nhiên, công ty vẫn giữ thông tin chi tiết về kế hoạch phát triển và triển khai của MGIE trong tương lai ngoài phạm vi nghiên cứu của họ.
Từ những dấu hiệu này, có thể nhận thấy Apple đang tập trung mạnh vào lĩnh vực trí tuệ nhân tạo tạo sinh (Generative AI). Theo thông tin từ The Verge, vào tháng 12 năm trước, các nhà nghiên cứu của Apple đã giới thiệu một khung máy học mã nguồn mở được gọi là MLX, nhằm hỗ trợ việc đào tạo các mô hình trí tuệ nhân tạo trên các chip Apple Silicon một cách dễ dàng hơn. Điều này cho thấy cam kết của Apple trong việc tạo ra môi trường thuận lợi và mở rộng cho phát triển các ứng dụng trí tuệ nhân tạo sáng tạo và tiên tiến trên nền tảng của họ.
- Galaxy A55 và A35: “Đảo Key” mới mẻ, ẩn chứa sức mạnh Exynos
- iPad Air “lột xác” với màn hình 12.9 inch và nhiều nâng cấp đáng giá
- iOS 18: Làn gió mới từ VisionOS hứa hẹn mang đến trải nghiệm đột phá
- Edgar Davids: Chàng cầu thủ với cặp kính nổi bật có một không hai
- Vision Pro: “Bữa tiệc” ứng dụng khiến bạn say mê
- Jude Bellingham sánh ngang với thành tích ghi bàn của David Beckham tại Real Madrid
Các bạn ơi, hãy cho mình biết ý kiến về bài viết này nhé!